# -*- coding = utf-8 -*-
# @Time    : 2025/3/25 下午8:33
# @Author  : yqk
# @File    : study-s_spider.py
# @Software: PyCharm

import re
#数据解析



# text = '姓名：张三 生日：1999年1月1日'
# t = re.match(r'姓名.*生日：\d{4}.*',text)
# print(t.group())

# text1 = '''
# 姓名：张三 生日1999年1月1日 毕业日期：2023月1日
# 姓名：李四 生日：2000年5月5日 毕业日期：2022年6月15日
# 姓名：王五 生日：1998年3月10日 毕业日期：2021年12月25日
# 姓名：赵六 生日：2001年7月20日 毕业日期：2024年5月30日
# '''
#
# t = re.findall(r'生日(.*?)毕业日期：',text1)
# print(t)


text2 = '''
<div class="item">
    <div class="item-img">
        <a href="https://www.jd.com/">
        你说你好啊
            <img src="https://img12.360buyimg.com/n7/jfs/t1/11609/2/11103/15908/5c0c0c0dEf0f0d0f0/f0f0d0f0.jpg.webp" alt="">
        </a>
    </div>
    你好
    <div class="item-info>
'''
t2 = re.sub(r'<.*?>', '', text2)
print(t2)